Datenschätze im Permafrost
Ein Ausflug in die Erforschung von Permafrostböden: Drei Monate besuchte Ngai Ham Chan vom GFZ mit dem HIDA Trainee Netzwerk die Forschungsgruppe PermaRisk am AWI. Was hat er hier über den Klimawandel und Data Science-Methoden gelernt?
Herr Chan, Sie haben am HIDA-Trainee-Netzwerkprogramm teilgenommen. Was hat sie gereizt?
Datenwissenschaftliche Methoden faszinieren mich seit Langem. Ich wollte sie schon immer in meine Forschung einbeziehen. Als mir ein Kollege begeistert vom HIDA-Trainee-Netzwerk erzählte, dachte ich sofort: Das ist die Gelegenheit, endlich mit Data Science praktische Erfahrung zu sammeln. Mein Vorgesetzter hat diese Idee sehr unterstützt, also habe ich mich beworben.
Durch Corona war es in diesem Jahr allerdings schwieriger, an Austauschprogrammen teilzunehmen. Das hat sie nicht abgeschreckt?
Nein, ich arbeite genauso gut am Bildschirm wie vor Ort. Zuhause bin ich sogar noch konzentrierter. Forschung findet in den Datenwissenschaften ohnehin viel am Computer statt, in der Pandemie ist das natürlich ein Vorteil. Für den persönlichen Austausch gibt es viele virtuelle Meeting-Tools. Zudem hatte ich zuvor schon mit meinem Gastgeber an einem anderen Projekt gearbeitet, die Integration in die Gastgruppe war daher leichter.
Woran haben Sie während des Austauschs gearbeitet?
Am Alfred Wegener Institut Helmholtz-Zentrum für Polar- und Meeresforschung (AWI) war ich Teil der Forschungsgruppe PermaRisk. Unsere Aufgabe ist es, die Qualität von Fernerkundungsdaten der Arktis zu verbessern. Wie sich die Arktis durch den Klimawandel verändert, lässt sich am besten an den Oberflächenmerkmalen der Landschaft ablesen. Der größte Teil der Arktis ist von einem Permafrostboden bedeckt. Steigen die Temperaturen, könnten große Mengen von organischem Kohlenstoff im Boden freigesetzt werden und den Klimawandel weiter beschleunigen. Um diese Auswirkungen einschätzen zu können, müssen wir die Landschaftsveränderungen quantifizieren und überwachen. So lassen sich kritische Bereiche leichter identifizieren. Viele Landschaftsveränderungen finden auf relativ kleinem Raum statt. Je besser daher die Qualität der Daten ist, desto aussagekräftiger und genauer sind die Voraussagen.
War dieses Forschungsfeld für Sie neu?
Ja, und es hat meinen Horizont sehr erweitert. Sonst beschäftige ich mich mit Themen aus der Astrophysik, den Planetenwissenschaften und der globalen Geophysik. Am Deutschen Geoforschungszentrum in Potsdam (GFZ), meinem Heimatzentrum, erforsche ich derzeit den Transport arktischer Sedimente.
Was haben Sie am AWI dazugelernt?
Ich habe viel über die Feinheiten und Tücken im Umgang mit Fernerkundungsdaten und die Werkzeuge gelernt, die bei der Vorverarbeitung helfen. Durch die Analyse der Daten kenne ich nun alle möglichen Merkmale der Permafrostlandschaft (deren Namen zum Teil schwer zu buchstabieren sind). Auch in den Datenwissenschaften selbst habe ich gewaltig dazugelernt. Bislang war Data Science nur mein Wochenend-Hobby, aus früheren Projekten hatte ich einige Erfahrungen mit statistischen Methoden. Die Lernkurve war dadurch umso steiler.
Ich weiß jetzt beispielsweise viel über die Funktionsweise und das Training von generativen adversarischen Netzen, bei denen zwei neuronale Netze in einem Nullsummenspiel gegeneinander antreten. Ich kenne verschiedene Designs, einige Verlustfunktionen mit ihren Stärken und Schwächen. Um die mathematischen Grundlagen einer der möglichen Verlustfunktionen zu verstehen, habe ich sogar eine Vorlesung des Mathematikers Cedric Villani über optimalen Transport angeschaut – das hätte ich mir vorher nie vorstellen können. Der Austausch hat mir noch mal gezeigt, wie viel Spaß die Arbeit mit Modellen für maschinelles Lernen macht.
Wie sah denn ein typischer Arbeitstag in Ihrem Gastzentrum aus?
Meist habe ich von zu Hause gearbeitet. Ich arbeite gerne bis in die Nacht, daher beginne ich meinen Tag am späten Vormittag mit einem starken Kaffee oder Tee. Die meiste Zeit programmiere ich oder lese Forschungsartikel, manchmal schaue ich ein YouTube-Video zu meinem Themenfeld. Mit meinem Gastgeber konnte ich mich bei Bedarf über Skype austauschen. Die Gruppe trifft sich mehrmals die Woche, auch da bekam ich schnelle Hilfe. Wir trafen uns außerdem regelmäßig mit einem anderen Kollegen, der sich mit Fernerkundung und maschinellem Lernen auskennt. Die Tage sind wie im Flug vergangen.
Sie haben viele neue Kontakte geknüpft. Wie hilft Ihnen das bei Ihrer weiteren Arbeit?
Wir bereiten bereits eine Veröffentlichung zu diesem Projekt vor. Zudem braucht mein aktuelles Projekt am Deutschen Geoforschungszentrum Daten zur Validierung und Abstimmung, die Partner meines Gastzentrums verfügen über genau das Fachwissen, das wir brauchen. In den nächsten Jahren werden wir zusammen an einem längerfristigen, größeren Projekt im Bereich der künstlichen Intelligenz arbeiten.
Würden Sie den Austausch anderen Wissenschaftlern empfehlen?
Unbedingt. Das Programm ist eine großartige Gelegenheit, sich in die Datenwissenschaften vorzutasten, egal ob man ganz neu auf dem Feld ist oder schon etwas Erfahrung hat. Besonders attraktiv für mich war auch, dass man ein Stipendium bekommt und der Vertrag mit dem Heimatzentrum während des Austauschs pausieren kann. Das nimmt viel Stress raus, ich konnte entspannter und konzentrierter dazulernen. Die neuen Kenntnisse und Arbeitsergebnisse fließen nun in meine Arbeit ein und eröffnen mir neue Möglichkeiten für die Zukunft. Auch die administrative Abwicklung des Austauschs ist dank aller Kollegen in der Verwaltung sowohl in den Zentren als auch bei HIDA unkompliziert. Ich hatte eine gute, konstruktive Zeit.
Auf einer Skala von eins bis zehn: Wie wahrscheinlich ist es, dass Sie das Trainee-Programm einem Freund oder Kollegen empfehlen?
Ganz klar: zehn.
Interview: Anja Dilk